花费 6 ms
样本不均衡对模型的影响

在做项目的时候,发现在训练集中,正负样本比例比例在1:7左右,虽然相差不多(但在实际获取的样本比例大概在1:2000左右),所以有必要探讨一下在样本不均衡的情况下,这些训练数据会对模型产生的影响。 ...

Sun Mar 10 18:59:00 CST 2019 1 3822
模型参数选择方法——GridSearch网格搜索

在日常模型训练过程中,模型有多种选择,模型的参数同样也有多种选择,如何根据同一批数据选出最适合的模型和参数呢? 一般情况下,模型还比较好选择,是选用机器学习中分类模型例如 LR、SVM或XGBoos ...

Thu Mar 14 23:31:00 CST 2019 0 1826
深度学习——L0、L1及L2范数

在深度学习中,监督类学习问题其实就是在规则化参数同时最小化误差。最小化误差目的是让模型拟合训练数据,而规则化参数的目的是防止模型过分拟合训练数据。 参数太多,会导致模型复杂度上升,容易过拟合,也就是 ...

Mon Nov 19 19:36:00 CST 2018 0 1434
交叉验证

什么是交叉验证? 它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。 主要是用于小部分数据集中。通过图片可以看出,划分出来的测试集(t ...

Mon Sep 17 23:25:00 CST 2018 0 1571
validation curve 验证曲线与超参数

验证曲线的作用 我们知道误差由偏差(bias)、方差(variance)和噪声(noise)责成。 偏差:模型对于不同的训练样本集,预测结果的平均误差。 方差:模型对于不同训练样本集的敏感程度 ...

Thu Sep 20 00:58:00 CST 2018 0 1513
常用激活函数比较

本文结构: 什么是激活函数 为什么要用 都有什么 sigmoid、ReLU、softmax的比较 如何选择 1. 什么是激活函数 如下图,在神经元中,输入的input ...

Thu Oct 11 05:47:00 CST 2018 0 997
拿到机器学习数据后,该如何对数据进行划分?

在处理机器学习任务时,我们都需要使用数据,当然,有时候数据集可以很大,有时候数据集数量不是很理想,那么如何针对这些数据得出更加有效的模型呢? 大型数据集 Idea #1: 当我们拿到数据集 ...

Fri Nov 09 01:50:00 CST 2018 0 722

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM